Lineamientos y Consideraciones para la Escritura del Ensayo
Lineamientos para Escritura de Ensayo:
El ensayo debe estar asociado a una propuesta de realizar a futuro un proyecto de Ciencia de Datos y para esto se tendrán presente las siguientes consideraciones.
Seleccionar un tema de mucho interés para el alumno, dentro del área económica y/o social enmarcada en Venezuela, que pueda ser sometido a un “ciclo de ciencia de datos”. Cuando se habla de económico y/o social, puede ser un sector muy pequeño, ya que la propuesta de tema de estudio no debe aspirar a resolver un gran tema.
Sobre este tema, el alumno debe hacer un desarrollo escrito, cercano a dos cuartillas, donde evalúe si considera que el tema seleccionado resulta de interés, puede hacer algún aporte, por diminuto que sea, a la investigación económica, a la comunidad o a los científicos sociales.
Teniendo como base lo anterior, podemos entender que el Ensayo se define como: un texto argumentativo y reflexivo que sirva como una introducción y justificación para el futuro proyecto de ciencia de datos que haremos. En lugar de presentar resultados, el ensayo busca explorar y comunicar ideas, planteando un tema relevante y viable que pueda someterse al análisis dentro de un ciclo de ciencia de datos.
Ejemplos:
- Análisis de patrones de consumo en pequeños negocios locales
- Descripción: Evaluar los factores que afectan las ventas diarias en comercios minoristas en una zona de determinada.
- Fuentes de datos:
- Datos de transacciones de punto de venta.
- Encuestas locales sobre hábitos de compra.
- Datos de tráfico peatonal.
- Optimización del transporte público en zonas urbanas pequeñas
- Descripción: Identificar rutas y horarios óptimos basados en la demanda real de los usuarios.
- Fuentes de datos:
- Datos de tarjetas de transporte o aplicaciones de movilidad.
- Información de GPS en autobuses.
- Encuestas a usuarios.
- Impacto de la digitalización en la competitividad de microempresas rurales
- Descripción: Analizar si el acceso a herramientas digitales mejora la rentabilidad.
- Fuentes de datos:
- Encuestas realizadas en comunidades rurales.
- Datos de transacciones antes y después de la implementación de herramientas digitales.
- Indicadores de conectividad de la región.
- Efectos de las remesas en el emprendimiento local
- Descripción: Analizar si las remesas fomentan la creación de microempresas.
- Fuentes de datos:
- Bases de datos gubernamentales sobre remesas.
- Encuestas sobre empleo informal.
- Registros empresariales locales.
- Impacto del cambio climático en la producción agrícola de cultivos específicos
- Descripción: Analizar cómo las variables climáticas están afectando los rendimientos agrícolas.
- Fuentes de datos:
- Datos meteorológicos históricos y de estaciones locales.
- Registros de producción agrícola.
- Sensores de humedad y temperatura en cultivos.
- Efectos del comercio electrónico en mercados tradicionales
- Descripción: Evaluar el impacto del crecimiento del comercio electrónico sobre el comercio minorista.
- Fuentes de datos:
- Datos de ventas en plataformas de comercio electrónico.
- Encuestas a pequeños comerciantes.
- Registros de cierres de negocios locales.
- Texto en reseñas de consumidores.
- Análisis del impacto económico de un evento local:
- Descripción: analizar el impacto económico de un evento específico, como un festival, una nueva empresa o un desastre natural, en una comunidad local.
- Fuentes de datos:
- Datos de ventas de negocios locales.
- Encuestas a residentes.
- Datos de movilidad.
- Datos de redes sociales.
- Estudio de la desigualdad económica en una ciudad:
- Descripción: analizar la distribución del ingreso y la riqueza en una ciudad, identificando áreas con mayor desigualdad y explorando las posibles causas.
- Fuentes de datos:
Censos, datos fiscales.
datos de propiedad inmobiliaria.
- Análisis del comportamiento del consumidor en un sector específico:
- Descripción: analizar el comportamiento de los consumidores en un sector específico, como el comercio electrónico, la restauración o el turismo.
- Fuentes de datos:
- Datos de transacciones.
- encuestas a consumidores.
- datos de redes sociales.
- Evaluación del impacto de un programa social:
- Descripción: evaluar el impacto de un programa social específico, como un programa de capacitación laboral o un programa de asistencia alimentaria, en los beneficiarios.
- Fuentes de datos:
- Datos administrativos del programa.
- encuestas a los beneficiarios.
Propuesta de Proyecto Final de Ciencia de Datos:
Objetivo General:
El objetivo principal de este proyecto es que los estudiantes apliquen sus conocimientos y habilidades en el lenguaje de programación R para analizar un problema relevante para Venezuela o un sector de la sociedad. Los estudiantes deberán seguir las fases estándar del ciclo de vida de proyectos de ciencia de datos: importar, ordenar, transformar-limpiar, visualizar, modelar y comunicar.
En general, sobre el Ensayo que están trabajando, dentro de las siguientes fases y puntos, es de la Fase 1 en sus puntos 1, 2 y 3, los que estamos abordando en este momento.
Fase 1: Selección de la Problemática
1. Identificación de Temas Relevantes:
- Los estudiantes deben identificar un tema relevante para Venezuela que les interese personalmente. Algunos ejemplos pueden incluir:
Análisis de la inflación y su impacto en el consumo
Evaluación del desempleo y las tendencias laborales
Estudio de la distribución de ingresos y pobreza
Análisis de la calidad de vida en diferentes regiones del país
Investigación sobre el acceso a servicios básicos (agua, electricidad, salud)
Los estudiantes deben justificar por qué este tema les interesa y cómo creen que puede contribuir al campo de la ciencia de datos.
2. Definición de la Pregunta de Investigación:
- Basándose en el tema seleccionado, los estudiantes deben formular una pregunta de investigación clara y específica.
- La pregunta debe ser susceptible de análisis mediante técnicas estadísticas y visualización de datos.
3. Evaluar posibles Fuentes de Datos:
- Junto con el profesor se evaluará la viabilidad de obtener y recolectar periódicamente datos que sirvan para el proyecto. Se puede evaluar que es factible o no realizar la investigación.
Nota: En la siguiente Fase 4, debería empezar el AnteProyecto, juntando todas las ideas de cada participante de su correspondiente equipo
4. Selección de Fuentes de Datos:
- Los estudiantes deben identificar y seleccionar fuentes de datos relevantes para su proyecto.
- Las fuentes pueden incluir:
- Estadísticas oficiales del INE (Instituto Nacional de Estadística)
- Informes económicos del Banco Mundial
- Datos de encuestas sociales
- Series temporales económicas
- Datos abiertos disponibles en plataformas como Kaggle o Data.gov
- Los estudiantes deben presentar una propuesta detallada de las fuentes de datos que planean utilizar, incluyendo un análisis de la calidad y relevancia de los mismos.
Nota: La selección final de las fuentes de datos será revisada por los profesores de la materia para asegurar su adecuación al proyecto y la factibilidad de recolectar tales datos, dado la realidad nacional.
Lo que sigue, es lo que se trabajará en el Proyecto.
Fase 2: Importar y Ordenar Datos
1. Importar Datos:
- Los estudiantes deben aprender a importar datos desde diferentes formatos (CSV, Excel, JSON, bases de datos SQL) utilizando R.
2. Ordenamiento y Exploración Inicial:
- Los estudiantes deben explorar los datos importados para entender su estructura y contenido.
- Deben identificar variables relevantes, tipos de datos y posibles problemas de calidad (valores faltantes, outliers, etc.).
Fase 3: Transformar y Limpiar Datos
1. Transformación de Datos:
- Los estudiantes deben aprender a transformar los datos para prepararlos para el análisis.
- Esto puede incluir la creación de nuevas variables, la recodificación de variables existentes o la aplicación de funciones matemáticas.
2. Limpieza de Datos:
- Los estudiantes deben identificar y manejar valores faltantes, outliers y otros problemas de calidad en los datos.
- Se les recomienda utilizar paquetes como `dplyr` para realizar operaciones de transformación y limpieza eficientes.
Fase 4: Visualización de Datos
1. Creación de Gráficos y Tablas:
- Los estudiantes deben aprender a crear gráficos y tablas que ayuden a visualizar los datos y responder la pregunta de investigación.
- Se les recomienda utilizar paquetes como `ggplot2`, plotly y otros paquetes que sean vistos en clase, para crear gráficos estéticamente atractivos y informativos.
2. Interpretación de Visualizaciones:
- Los estudiantes deben interpretar las visualizaciones creadas y relacionarlas con la pregunta de investigación.
- Deben ser capaces de comunicar claramente los hallazgos visuales en un contexto narrativo.
Fase 5: Modelado de Datos: (no es obligatorio esta fase)
1. Selección de Modelos Estadísticos
- Los estudiantes deben seleccionar y aplicar modelos estadísticos apropiados para responder la pregunta de investigación.
- Esto puede incluir regresiones lineales, análisis de variancia (ANOVA), series temporales o otros métodos según sea necesario.
2. Interpretación de Modelos:
- Los estudiantes deben interpretar los resultados obtenidos de los modelos y relacionarlos con la pregunta de investigación.
- Deben ser capaces de comunicar claramente las implicaciones de los hallazgos estadísticos en un contexto narrativo.
Fase 6: Comunicación de Resultados una de las fases más importantes en lo que estamos haciendo
1. Creación de Informes, Dashboard o Aplicación Web:
- Los estudiantes deben aprender a crear informes que presenten sus análisis y resultados.
- Se les recomienda utilizar herramientas como qmd para combinar código, texto y visualizaciones en un solo documento. De esto hablaremos con detalle a lo largo del curso.
2. Presentación Oral:
- Los estudiantes deben preparar una presentación oral breve (10-15 minutos) que resuma su proyecto, incluyendo la pregunta de investigación, los métodos utilizados, los resultados obtenidos y las conclusiones.
- La presentación debe ser clara, concisa y visualmente atractiva.
3. Presentación en un Afiche:
- Luego conversaremos sobre este punto